LLM Reasoning

3 статьи

🧠 DeepSeek R1 против OpenAI o1: как алгоритм GRPO изменил правила игры в ИИ

Stanford Online · 14.11.25 · 47,6 тыс. просм.

🧠 Стэнфорд CME295: Как алгоритм GRPO и DeepSeek R1 изменили логику нейросетей

Stanford Online · 14.11.25 · 47,6 тыс. просм.

🧠 Иман Мирзаде из Apple: «Мы строим самолёт, чтобы долететь до Луны»

Machine Learning Street Talk · 19.03.25 · 11,5 тыс. просм.